Escola de Métodos em Ciência Política
Cuidado com a utilização de etiquetas (nomes de objetos) com o mesmo nome de funções, pode gerar confusão no script
Em basicamente tudo que iremos fazer no R, a classe da informação importa Em termos elementares, ou ao nível dos valores, existem três grandes classes:
- Numeric (númerico);
- Logical (lógico);
- Character ou factor (caracteres);
Para obter a informação sobre a classe, iremos aprender nossa primeira função no R: class()
numeric é a classe composta por valores númericoslogical é a classe composta por TRUE, FALSE e NANão é preciso escrever sempre TRUE e FALSE, podemos resumir para T e F, respectivamente
Por trás dos valores T e F, há valores númericos correspondente a 1 e 0
character é a classe composta por nomes
Importante característica é que os nomes devem estar dentro de aspas, caso contrário, o R não reconhecerá como caracter
%in% na Seleção de elementos[1] TRUE
[1] FALSE
[1] FALSE
Um data.frame é o mesmo que uma tabela do SQL ou uma planilha Excel
seus dados provavelmente serão importados para um objeto data.frame
data.frame’s são listas especiais em que todos os elementos possuem o mesmo comprimento.
Cada elemento dessa lista pode ser pensado como uma coluna da tabela - ou como uma variável. Uso do ‘$’
Seu comprimento representa o número de linhas - ou seja, de observações
Funções úteis:
head() # Mostra as primeiras 6 linhas.
tail() # Mostra as últimas 6 linhas.
dim() # Número de linhas e de colunas.
names() # Os nomes das colunas (variáveis).
str() # Estrutura do data.frame. Mostra, entre outras coisas, as >classes de cada coluna.
cbind() # Acopla duas tabelas lado a lado.
rbind() # Empilha duas tabelas.
|
| | 0%
|
|=== | 4%
|
|===== | 7%
|
|======= | 10%
|
|========= | 13%
|
|============ | 17%
|
|================ | 22%
|
|================== | 26%
|
|===================== | 30%
|
|======================= | 32%
|
|========================= | 36%
|
|========================== | 37%
|
|============================= | 41%
|
|=============================== | 45%
|
|================================== | 49%
|
|===================================== | 52%
|
|======================================= | 56%
|
|========================================== | 60%
|
|============================================= | 64%
|
|=============================================== | 68%
|
|================================================= | 71%
|
|==================================================== | 74%
|
|======================================================= | 78%
|
|========================================================= | 82%
|
|============================================================ | 86%
|
|=============================================================== | 89%
|
|================================================================= | 93%
|
|======================================================================| 100%
- Provavelmente, demorará alguns segundos, até minutos, para a importação
- Além disso, essa forma **demanda acesso à internet**
[1] "DT_GERACAO" "HH_GERACAO"
[3] "ANO_ELEICAO" "CD_TIPO_ELEICAO"
[5] "NM_TIPO_ELEICAO" "NR_TURNO"
[7] "CD_ELEICAO" "DS_ELEICAO"
[9] "DT_ELEICAO" "SG_UF"
[11] "SG_UE" "NM_UE"
[13] "CD_CARGO" "DS_CARGO"
[15] "TP_AGREMIACAO" "NR_PARTIDO"
[17] "SG_PARTIDO" "NM_PARTIDO"
[19] "NR_FEDERACAO" "NM_FEDERACAO"
[21] "SG_FEDERACAO" "DS_COMPOSICAO_FEDERACAO"
[23] "SQ_COLIGACAO" "NM_COLIGACAO"
[25] "DS_COMPOSICAO_COLIGACAO" "CD_SITUACAO_LEGENDA"
[27] "DS_SITUACAO" "NM_TIPO_DESTINACAO_VOTOS"
str()tibble [251 × 28] (S3: tbl_df/tbl/data.frame)
$ DT_GERACAO : chr [1:251] "13/11/2024" "13/11/2024" "13/11/2024" "13/11/2024" ...
$ HH_GERACAO : 'hms' num [1:251] 10:54:54 10:54:54 10:54:54 10:54:54 ...
..- attr(*, "units")= chr "secs"
$ ANO_ELEICAO : num [1:251] 2018 2018 2018 2018 2018 ...
$ CD_TIPO_ELEICAO : num [1:251] 2 2 2 2 2 2 2 2 2 2 ...
$ NM_TIPO_ELEICAO : chr [1:251] "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" "ELEIÇÃO ORDINÁRIA" ...
$ NR_TURNO : num [1:251] 1 1 1 1 1 1 1 1 1 1 ...
$ CD_ELEICAO : num [1:251] 297 297 297 297 297 297 297 297 297 297 ...
$ DS_ELEICAO : chr [1:251] "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" "Eleições Gerais Estaduais 2018" ...
$ DT_ELEICAO : chr [1:251] "07/10/2018" "07/10/2018" "07/10/2018" "07/10/2018" ...
$ SG_UF : chr [1:251] "DF" "DF" "DF" "DF" ...
$ SG_UE : chr [1:251] "DF" "DF" "DF" "DF" ...
$ NM_UE : chr [1:251] "DISTRITO FEDERAL" "DISTRITO FEDERAL" "DISTRITO FEDERAL" "DISTRITO FEDERAL" ...
$ CD_CARGO : num [1:251] 8 9 3 9 4 8 8 5 3 8 ...
$ DS_CARGO : chr [1:251] "DEPUTADO DISTRITAL" "1º SUPLENTE" "GOVERNADOR" "1º SUPLENTE" ...
$ TP_AGREMIACAO : chr [1:251] "COLIGAÇÃO" "COLIGAÇÃO" "COLIGAÇÃO" "PARTIDO ISOLADO" ...
$ NR_PARTIDO : num [1:251] 50 18 27 30 44 23 16 16 90 77 ...
$ SG_PARTIDO : chr [1:251] "PSOL" "REDE" "DC" "NOVO" ...
$ NM_PARTIDO : chr [1:251] "PARTIDO SOCIALISMO E LIBERDADE" "REDE SUSTENTABILIDADE" "DEMOCRACIA CRISTÃ" "PARTIDO NOVO" ...
$ NR_FEDERACAO : num [1:251] -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
$ NM_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ SG_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ DS_COMPOSICAO_FEDERACAO : chr [1:251] "#NULO#" "#NULO#" "#NULO#" "#NULO#" ...
$ SQ_COLIGACAO : num [1:251] 7e+10 7e+10 7e+10 7e+10 7e+10 ...
$ NM_COLIGACAO : chr [1:251] "ELAS POR NÓS: SEM MEDO DE MUDAR O DF" "Brasília de Mãos Limpas" "CORAGEM E RESPEITO PELO POVO" "#NULO#" ...
$ DS_COMPOSICAO_COLIGACAO : chr [1:251] "PSOL / PCB" "PSB / PV / PC do B / PDT / REDE" "PR / PSDB / DEM / DC" "NOVO" ...
$ CD_SITUACAO_LEGENDA : chr [1:251] "D" "D" "D" "D" ...
$ DS_SITUACAO : chr [1:251] "DEFERIDO" "DEFERIDO" "DEFERIDO" "DEFERIDO" ...
$ NM_TIPO_DESTINACAO_VOTOS: chr [1:251] "Válido (legenda)" "#NE" "#NE" "#NE" ...
- attr(*, ".internal.selfref")=<externalptr>
head()# A tibble: 2 × 28
DT_GERACAO HH_GERACAO ANO_ELEICAO CD_TIPO_ELEICAO NM_TIPO_ELEICAO NR_TURNO
<chr> <time> <dbl> <dbl> <chr> <dbl>
1 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
2 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
# ℹ 22 more variables: CD_ELEICAO <dbl>, DS_ELEICAO <chr>, DT_ELEICAO <chr>,
# SG_UF <chr>, SG_UE <chr>, NM_UE <chr>, CD_CARGO <dbl>, DS_CARGO <chr>,
# TP_AGREMIACAO <chr>, NR_PARTIDO <dbl>, SG_PARTIDO <chr>, NM_PARTIDO <chr>,
# NR_FEDERACAO <dbl>, NM_FEDERACAO <chr>, SG_FEDERACAO <chr>,
# DS_COMPOSICAO_FEDERACAO <chr>, SQ_COLIGACAO <dbl>, NM_COLIGACAO <chr>,
# DS_COMPOSICAO_COLIGACAO <chr>, CD_SITUACAO_LEGENDA <chr>,
# DS_SITUACAO <chr>, NM_TIPO_DESTINACAO_VOTOS <chr>
head()# A tibble: 2 × 28
DT_GERACAO HH_GERACAO ANO_ELEICAO CD_TIPO_ELEICAO NM_TIPO_ELEICAO NR_TURNO
<chr> <time> <dbl> <dbl> <chr> <dbl>
1 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
2 13/11/2024 10:54:54 2018 2 ELEIÇÃO ORDINÁRIA 1
# ℹ 22 more variables: CD_ELEICAO <dbl>, DS_ELEICAO <chr>, DT_ELEICAO <chr>,
# SG_UF <chr>, SG_UE <chr>, NM_UE <chr>, CD_CARGO <dbl>, DS_CARGO <chr>,
# TP_AGREMIACAO <chr>, NR_PARTIDO <dbl>, SG_PARTIDO <chr>, NM_PARTIDO <chr>,
# NR_FEDERACAO <dbl>, NM_FEDERACAO <chr>, SG_FEDERACAO <chr>,
# DS_COMPOSICAO_FEDERACAO <chr>, SQ_COLIGACAO <dbl>, NM_COLIGACAO <chr>,
# DS_COMPOSICAO_COLIGACAO <chr>, CD_SITUACAO_LEGENDA <chr>,
# DS_SITUACAO <chr>, NM_TIPO_DESTINACAO_VOTOS <chr>
CURSO DE R